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Datenspeicherung: Informatische Grundlagen 


e \Was sind Daten? 


e Datum: lat. dare = geben, ausfertigen, schreiben. 


e „Die Informatik und Datenverarbeitung (EDV) benutzen Daten 
als (maschinen-)lesbare und -bearbeitbare Repräsentation 
von Information. Die Information wird dazu in Zeichen 
(ketten) kodiert, deren Aufbau strengen Regeln folgt, der 
so genannten Syntax...Die Semiotik definiert Daten als 


potenzielle Information.“ 
Aus: http://de.wikipedia.org/wiki/Daten. 


e „Man unterscheidet: 
* strukturierte Daten (zum Beispiel Datenbanken, XML) 
* unstrukturierte Daten (beispielsweise Dokumente) 
Während sich strukturierte Daten relativ einfach maschinell 
weiterverarbeiten lassen, ist dies bei unstrukturierten Daten 
nur schwer beziehungsweise ungenau möglich.” Aus: s. o. 


> Portal zu Bibliothek - Information - Dokumentation: 
http://de.wikipedia.org/wiki/Portal_BID 
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Datenspeicherung: Informatische Grundlagen 


e Was sind Informationen? 


e Information: lat. in-formare = Gestalt geben, bilden. 


e Nachrichtentechnik: „...Information umfasst eine Nachricht 
zusammen mit ihrer Bedeutung für den Empfänger. Diese 
Bedeutung kann darin bestehen, dass ein Mensch der 
Nachricht einen Sinn gibt, oder die Bedeutung kann indirekt 
aus der Art der weiteren Verarbeitung der Nachricht 
geschlossen werden...” Aus: Schülerduden „Die Informatik“, 1986. 


° „Information...ist potenziell oder aktuell vorhandenes, 
nutzbares oder genutztes Wissen. Wesentlich für die 
Information ist die Wiedererkennbarkeit sowie der 
Neuigkeitsgehalt anhand eines bestimmten Musters von 


Materie und/oder Energieformen in Raum und/oder Zeit...” 
Aus: http://de.wikipedia.org/wiki/Information. 
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Datenspeicherung: Informatische Grundlagen 


e \Was ist Wissen? 


e Wissen: idg. Wurzel, ahd. wischan = gesehen haben. 


e „Wissen...bezeichnet die Gesamtheit aller organisierten 
Informationen mitsamt ihrer wechselseitigen Zusammen- 
hänge, auf deren Grundlage ein (vernunftbegabtes) System 
handeln kann. Das Wissen erlaubt es einem solchen System - 
vor seinem Wissenshorizont und mit der Zielstellung der 
Selbsterhaltung - sinnvoll und bewusst auf Reize zu 
reagieren.” Aus: http://de.wikipedia.org/wiki/Wissen. 


e „Das Wissen erfordert eine aussagekräftige Erklärung 
bzw. Begründung. Grundlegendes Kriterium ist das der 
Überprüfbarkeit bzw. Nachvollziehbarkeit. Als weiterer 
Maßstab gilt die Übereinstimmung des Wissens mit der 
wahrnehmbaren Realität.” Aus: s. o. 
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Datenspeicherung: Informatische Grundlagen 


e Was sind analoge Daten? 


e analog: „kontinuierlich, stetig veränderbar. Eine Menge von 
Werten heißt analog, wenn sie einem Intervall der reellen 
Zahlengeraden entspricht...Analog wird in der Datenver- 


arbeitung meist als Gegensatz zu ‚digital‘ verwendet.“ 
Aus: Schülerduden „Die Informatik”, 1986. 
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Datenspeicherung: Informatische Grundlagen 


e Was sind digitale Daten? 


e digital (lat. digitus = Finger — zählen): „Eigenschaft eines 
Elements, nur diskrete, d. h. nicht stetig veränderbare Werte 
annehmen zu können...Ein digitales Zeichen gehört zu einem 
endlichen Zeichenvorrat mit gut unterscheidbaren 


Elementen...“ Aus: Schülerduden „Die Informatik“, 1986. 
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Datenspeicherung: Informatische Grundlagen 


e Was sind binäre Daten? 
e “binär (engl. binary): Ein Element heißt binär, wenn es nur 
zwei sich gegenseitig ausschließende Zustände annehmen 


kann. Diese Zustände werden oft mit 0 und 1...bezeichnet...“ 
Aus: Schülerduden “Die Informatik”, 1986. 


e Bsp. Binäres Zählen 


0 — 000 
- 1 — 001 
- 2 — 010 
- 3 — 011 
- 4 — 100 


e Bsp. Binäres Addieren 
> 010 
= “P — 011 


= =5 = 101 


` 
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Datenspeicherung: Informatische Grundlagen 


e Datenmenge: Was sind Bits und Bytes? 


e „Bit (engl. binary digit): Bezeichnung für die kleinste 
Darstellungseinheit für Daten in binärer Zahlendarstellung. Ein 


Bit kann die Werte binär Null und binär Eins annehmen.“ 
Aus: Schülerduden “Die Informatik”, 1986. 


e Byte (engl. by eight): „Eine Folge von 8 Bit wird als 1 Byte 
bezeichnet. Mit einem Byte lassen sich 256 verschiedene 
Objekte kennzeichnen und bei Verabredung der Codierung 
bedeutet die Übersendung von einer bestimmten Kombination 
von Null und Eins dann die Information, dass dieses dadurch 
bestimmte Objekt (aus einer Menge von höchstens 256 


Objekten) vorgelegen hat.“ 
Aus: „Wie funktioniert das? Der Computer“, 1990. 


e Kilobyte KB 210 B = 1.024 B 

e Megabyte MB 220 B = 1.048.576 B 

e Gigabyte GB 230 B = 1.073.741.824 B 

e Terabyte TB 240 B = 1.099.511.627.776 B 
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Datenspeicherung: Informatische Grundlagen 


e Was sind Datentypen? 


e „Unter einem Datentyp versteht man die Zusammenfassung 


von Wertebereichen und Operationen zu einer Einheit.“ 
Aus: Schülerduden “Die Informatik”, 1986. 


e Bsp. integer Ganze Zahlen + - * div mod 


e Bsp. real Reelle Zahlen + - * / Mathem. Funktionen 
e Bsp. char Zeichenmenge ord(Zeichen) char(Zahl) 
e Bsp. boolean true false Log. Funktionen AND OR NOT... 


e Komplexe Datentypen entstehen durch Konstruktion aus 
einfachen Datentypen. Bsp. array of integer, string, record. 
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Datenspeicherung: Informatische Grundlagen 


e Was sind Boolesche (logische) Funktionen? 


e Boolesche Algebra: Zweiwertiges formales System, das 1854 vom 
englischen Logiker George Boole (1815 - 1864) entwickelt wurde. 


e 1stellige Funktion NOT ( — ) : A sei eine Aussage. Die Aussage NOT A 
ist genau dann wahr, wenn A falsch ist. — Negation. 


e 2stellige Funktion AND ( A ) : A , B seien Aussagen. Die Aussage A AND 
B ist genau dann wahr, wenn sowohl A als auch B wahr ist. 
— Konjunktion, Durchschnittsmenge, Serienschaltung. 


e 2stellige Funktion OR ( v ) : A , B seien Aussagen. Die Aussage A OR B 
ist genau dann wahr, wenn mindestens eine der beiden Aussagen A, 
B wahr ist. — Disjunktion, Vereinigungsmenge, Parallelschaltung. 


° A NOT A A B A AND B A B A OR B 
f Ww E £ f DE f 
wW f f w f f w wW 

w f f w f wW 
W W wW W W wW 
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Datenspeicherung: Informatische Grundlagen 


e Daten vs. Metadaten 


° meta : griech. inmitten, hinter (örtlich), nach (zeitlich). 


e Metadaten werden im nachhinein aus Daten gewonnen. 


Sie sind Daten über Daten. 


e Im Bibliothekswesen entstehen Metadaten durch 
- Formale Erfassung — vgl. Nominalkatalog 
- Inhaltliche Erschließung — vgl. Schlagwortkatalog 


e Informatische Perspektive auf Datenspeicherung im 
Bibliothekswesen: 


e Phase 1: Daten analog Metadaten analog 
e Phase 2: Daten analog Metadaten digital 
e Phase 3: Daten digital Metadaten digital 
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Datenspeicherung: Informatische Grundlagen 


e Exkurs: KatZoom-Kataloge 


— http://katzoom.onb.ac.at/katzoom/ 


e KatZoom: Online-Zugriff auf digitalisierte Zettelkataloge, 
Entwicklung der ONB, Service auch für andere österreichische 
Bibliotheken, insgesamt > 12 Mio. Zettel online verfügbar. 


e Besonderheit: Zoom-Funktion 
- Alphabetische Ordnungsfolge der Zettelkataloge wird beibehalten. 
- Ausgewählter Suchbereich (Buchstabe) wird in 4 Teile geteilt. 


- Kurzanzeige mit erstem Zettel aus jedem der 4 Teile und letztem 
Zettel des Suchbereichs ermöglicht immer nähere Eingrenzung. 


e Bsp. Wichtige KatZoom-Kataloge an der ÖNB 


- Nominalkatalog 1501 - 1929 1.114.000 Zettel 
- Nominalkatalog 1930 - 1992 1.424.000 Zettel 
- Schlagwortkatalog 1501 - 1929 1.356.000 Zettel 
- Schlagwortkatalog 1930 - 1992 1.690.000 Zettel 
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Datenspeicherung: Informatische Grundlagen 


e Bsp. Zettel aus „Nominalkatalog 1930 - 1992" 


Aus: http://katzoom.onb.ac.at/katzoom/. 


2 ç 4 6) 


GI 


Praektischg erprobte Kalkulation für Fleisch 

eh. a" A Ska "EB -i zE, x OET 2 van OER 
und kur St. 2 verb. Aufl.-München:Pflaum[ 1955]. 
21 9,9 
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Datenspeicherung: Informatische Grundlagen 


e Bsp. Zettel aus „Schlagwortkatalog 1930 - 1992” 


Aus: http://katzoom.onb.ac.at/katzoom/. 


62,412 B 


sehra f , Franz:Praktisch erprobte Kalku- 
‚letion für Fleisch und Wurst. 
2.verb, Aufl.-München:Pflaunm 
[1955 1.21 5.8 | 
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Datenspeicherung: Informatische Grundlagen 


e Was ist eine Kartei? 


e „Eine Kartei ist eine geordnete Sammlung von Daten auf 
kleinformatigen Karten, wobei jede der Karten für eine 
Informationseinheit steht und damit ein Objekt der 


Wirklichkeit repräsentiert." 
Aus: http://de.wikipedia.org/wiki/Kartei. 


e „Zum effizienten Benutzen einer Kartei ist die korrekte 
Anordnung der Karten unbedingt erforderlich; andernfalls 
lassen sich Daten nicht finden.“ Aus: s. o. 


e „Eine Kartei kann auf eine Datenbank elektronisch abgebildet 
werden. Im Gegensatz zu einer Datenbank besteht eine Kartei 
allerdings meist nur aus einer einzigen Ansammlung 
strukturgleicher Karteikarten." Aus: s. o. 


e „Die elektronische Entsprechung einer Kartei ist demnach die 
Tabelle einer Datenbank. Eine Karteikarte entspricht dann 
einer Zeile in dieser Tabelle." Aus: s. o. 
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Datenspeicherung: Informatische Grundlagen 


e Lochkarte: Vorläufer 


e Ursprung: Spieldosen und ähnliche Apparate, in denen sich 
drehende Walze oder Scheibe mit Stiften oder Löchern 
Wiedergabe von Musikstücken ermöglicht. 


e Lochkartenähnliche Systeme etwa ab Mitte des 18. Jh. 
enthalten Anweisungsfolgen für wiederkehrende Abläufe. 
Bsp. Webstühle, Drehorgeln. 


e Randlochkarte: „Verschiedene Suchkriterien (zum Beispiel 
im Bibliothekswesen) wurden mit Löchern oder Schlitzen an 
allen 4 Rändern der Karte codiert. Man konnte mit einer 
langen Nadel in die Position eines Suchkriteriums stechen und 


die ausgewählten Karten aus dem Stapel herausziehen. ` 
Aus: http://de.wikipedia.org/wiki/Lochkarte. 
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Datenspeicherung: Informatische Grundlagen 


e Lochkarte: Maschinenlesbare Karteikarte 


e° „... Lochkartenformat geht auf die US-amerikanische 
Volkszählung 1890 zurück, zu der Herman Hollerith ein 
auf Lochkarten basierendes Verfahren einschließlich der 


zugehörigen Stanz- und Auswertemaschinen entwickelte.” 
Aus: http://de.wikipedia.org/wiki/Lochkarte. 


e „Eine Hollerith-Lochkarte ist ein rechteckiges, etwa 
18.7 cm x 8.3 cm großes Stück 0.17 mm dünner Karton, in 
das in vorgegebene Positionen spaltenweise Löcher gestanzt 
werden um eine Folge von Zeichen (heute würde man sagen: 
eine Zeile Text) zu codieren.“ Aus: s. o. 


e Lesen: mechanisch (Stifte), dann optisch (Lichtschranken). 


e Schreiben: Lochkartenstanzer mit Tastatur. 


e 3 Lochkartenstapel (batch — batch job, batch file): 
für Eingabedaten, für Programm, für Ausgabedaten. 
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Datenspeicherung: Informatische Grundlagen 


e Lochkarte mit 80 Zeichen: IBM-Patent von 1928 


„Jedes Zeichen wird durch eine bestimmte Lochkombination 
dargestellt, wobei Ziffern durch ein Loch, Buchstaben und 
Sonderzeichen durch zwei oder drei Löcher codiert werden.“ 
Aus: Schülerduden “Die Informatik”, 1986. — Zonenteil / Ziffernteil. 


Lochschntubersetzung 
ABCDEFGHI J#LMNOPOR 


z. N! 1 . kay. Aona 
BHEBEHBBBBB i 1 
BERERRERE 
41 
00000000000000000000000FURRHHHEO0000000080000000800000000 BANNAN 0000 N 
n By 


x” ve use 1 n 5 R 


nnan m 


8888888888888888888B8888885888 sñeso0ssasoWssssWNWWsssaWNNWsssaWINI EEA LIL EA 
99999999989999999999109799999 971990999999899999999999979999999979999999999999999 


e PN á 2 W 2 2 NN 22 FR SN 39 3 S MEI TUE HH & @ @ N RM m 79 


ischreid der | tı 
Zittern 3-9 ae lochpersition 
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Datenspeicherung: Informatische Grundlagen 


e Was sind Datenformate? (1) 


e Datenformat, Zeichensatz, Code: „Abbildungsvorschrift, die 
jedem Zeichen eines Zeichenvorrats (Urbildmenge) eindeutig 
ein Zeichen oder eine Zeichenfolge aus einem möglicherweise 


anderen Zeichenvorrat (Bildmenge) zuordnet.“ 
Aus: Schülerduden "Die Informatik”, 1986. 


e Morse-Code: Zeichenfolgen verschiedener Länge, daher nicht 
umkehrbar eindeutig. Bsp. e= „ Z= --. 


e Telegraphen-Code: 5 Bit — Codierung von 2> = 32 Zeichen. 


e Hollerith-Code: 12 Bit. — Zeilen einer Lochkarte mit/ohne 
Lochung. 10 Ziffern, 26 Buchstaben, 28 Sonderzeichen. 

e BCD-Code: Binary Coded Decimals. 4 Bit (1 Halbbyte). 
— Binäre Darstellung der dezimalen Ziffern 0 - 9. 

e EBCDIC: Extended Binary Coded Decimals Interchange Code. 
8 Bit (1 Byte): Linkes Halbbyte Zonenteil, rechtes Ziffernteil. 
Verwendung im Bereich der Großrechner bis heute. 
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Datenspeicherung: Informatische Grundlagen 


e Was sind Datenformate? (2) 


e ASCII: American Standard Code for Information Interchange. 
Standard seit 1968. 7 Bit + 1 Prüfbit: Zeichen von 0 bis 
fortlaufend numeriert. Bsp. „A` hat Code 65. 


0 


1 


2 


2 


4 


5 


6 


7 


O| NUL SOH STX ETX EOT ENQ ACK BEL 
16| DLE DC1 DC2 DC3 DC4 NAK SYN ETB 


32| 
48| 
64| 
go] 
36] 
112] 


SP 
0 
@ 
P 


P 


I 


Q O (O PP P=. 


b O Z UD N % 


# 


u OQ nn w 


tf O, H O b <> 


Q 
° 


c @ G FE O 


<4 h < Hj oO, @ 


so => QN 


8 
BS 
CAN 


xD x m m — 


9 
HT 
EM 


K Faz Fç Pi çO: — 


10 
LF 
SUB 


* 


U 


Z 


Z 


12 
FF 
FS 


,r 


< 
L 
\ 
1 
| 


127 


DEL 


e ANSI-Code: American National Standards Institute. 8 Bit. 


Verwendung in ersten Versionen von MS Windows. 


e ISO-8859-Codes: Internat. Organisation for Standardization. 
8 Bit. Notwendigkeit durch Verbreitung des Internets. Bsp.: 


ISO-8859-1 (ISO-Latin-1): ähnlich ANSI. USA und Westeuropa. 
15S0-8859-2 (ISO-Latin-2): Slawische Sprachen. 
15S0-8859-3 (ISO-Latin-3): Esperanto, Maltesisch, Türkisch. 


15S0-8859-4 (ISO-Latin-4): Baltische Sprachen (Estnisch, Lettisch, Litauisch). 
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Datenspeicherung: Informatische Grundlagen 


e Was sind Datenformate? (3) 


e UNICODE: 16 Bit (2 Byte) für 21° = 65.536 Zeichen, um 
Problem der Darstellung von Zeichen endgültig zu lösen. 
Enthält Hiragana, Katakana, CJK Unified Ideographs (für 
chinesich, japanisch, koreanisch) etc. Erste 256 Zeichen 
entsprechen ISO-Läatin-1. Windows NT 4.0 1996 erstes 
Betriebssystem, das 16-Bit-UNICODE unterstützt. 


e UTF-8 (UNICODE Transformation Format 8 Bit) derzeit erfolg- 
reichste UNICODE-Umsetzung, Bytefolgen variabler Länge von 
1 bis 4 Byte. 1-Byte-Variante entspricht ASCII-Code. — XML. 


e Bsp.: Zeichen aus Schriftart Arial Unicode MS unter MS Word 


armenisch tamilisch japanisch 


bad Bro ENNY Ik 
fwg FEWEKE 
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Datenspeicherung: Informatische Grundlagen 


e Was ist eine Datei? 


e Datei (von Daten + Kartei, engl. file): „Bezeichnung für eine 
nach bestimmten Gesichtspunkten zusammengestellte Menge 
von Daten. Eine Datei besteht aus einer Folge von gleichartig 
aufgebauten Datensätzen; jeder Datensatz setzt sich im 
allgemeinen aus mehreren unterschiedlichen Komponenten, 
den Feldern, zusammen." Aus: Schülerduden “Die Informatik”, 1986. 


e Anfangs sequenzielle Dateiorganisation auf Magnetband: 
Datensätze können nur in Reihenfolge der Eingabe gespeichert 
und wieder abgerufen werden. > „Virtueller Lochkartenstapel". 


Bsp. Datei mit 3 Datensätzen fixer Länge zu je 130 Zeichen 


Nr, A or Titel Jahr 
| |5 10 La 20] 25 30 35 40 ... 1130 
001Kant, I. Kritik der reinen Ve ... 1787 
002Nietzsche, F. Jenseits von Gut und ... 1886 
0OSWiıttgenstein, Li Tractatus 1l6916°5-phr «». 1921 
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Datenspeicherung: Informatische Grundlagen 


Dateiformate: Text Files vs. Binary Files 


Textdatei: Speicherung als menschenlesbarer Klartext, 
Bearbeitung durch Editor. „Wichtige Beispiele sind XML, 
HTML, die Satzsprache LaTeX, die Druckseitenbeschreibungs- 
sprache PostScript und nicht zuletzt die zahlreichen 
proprietären Konfigurationsdateien für Betriebssysteme 
und Anwendungen.“ Aus: http://www.galileocomputing.de. 


> Buch „Kompendium der Informationstechnik" gratis downloadbar: 
http: / /www.galileocomputing.de/openbook/kit/index.htm 


Binärdatei: „Es handelt sich um Dateien mit numerischen 
Inhalten, wobei ohne Kenntnis der Spezifikation des jewei- 
ligen Dateiformats nicht erkennbar ist, ob die gespeicherten 
Zahlen an bestimmten Stellen für Befehle oder für Nutz- 
daten stehen.“ Aus: s. o. 


- Grafik-Dateiformate ‚Due ¿Gat Jog tif 
- Audio-Dateiformate .wav .mp3 
- Video-Dateiformate .mov .avi .mpg 
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Datenspeicherung: Informatische Grundlagen 


Bsp. Öffnen einer Binärdatei im Dateiformat .gif 
in einem Editor für Textdateien 


GIF89aÜ v + GSEDFDIIIS"$-°-dfdi1i1ieseTVTÜBÜUA4244 Ktvtübü ^ 


= I < Ü * O äc ve* [ Ô- wq°|e=gecç 8°; 
úÓ ww ` àà6y w Syaelycceywy 70 ;6Ó ww Eh ‘cc w ” 3& ;Ö w 
Eb à tes w öpatO'üu-w “^, @ w ý ý Y 7,826 w Äng c 


a | 


wq Ú ÐX )& ÜT ác ~ H é Aw °P 
2ç ë w yyyyeyyyy ÿÞlý`[ýççýww ° tí - q p6i | gI 

1^ à-q` Aöz æ w \\äç+-wwq @ 8a ae 

È (ç w å l [ ç wà8Agøa 6 y’yü yw V MA) õç 
ww YTycoyy 7d / Se ww à èç w b îXK oi ç ç w 8Yyl[laybyN 

Y  èè dõ/èççwww lÉ oë N (2 -YyNy 5 ^EèÔ w ci 

O ç wÀÙÜîO 0 d4 &c £Pn] :y+ÖFww !ù 1 

Ü v Gy H° Áf*NE° ;Ät#JeHteÄ< 3JjÜEB+äE XIOMHL°®AA’ S$Cv4 3à e & 


(( OQQH/ se !H â\šà 
M„CU0Haal>ur"&äö” QrËn10OLX "TÄO DI?]*YUAT S.\J,8J„6- 
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Grundzüge der Datenspeicherung im Bibliothekswesen 


e Datenspeicherung: Informatische Grundlagen 
- Daten, Informationen, Wissen 
- Analoge, digitale, binäre Daten 
Datentypen, Boolesche Funktionen 
Karteikarte - Kartei, Datensatz - Datei 
Datenformate, Dateiformate 


e Relationale Datenbanken: Modellierung & Zugriff 
- Datenbank-Architektur, Datenbank-Modelle 
- Entitäten, Attribute, Relationen 

ERM: Entity Relationship Model 

- Schlüsselfelder, Datenintegrität 

SQL: Structured Query Language 
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Relationale Datenbanken: Modellierung & Zugriff 


e Was ist eine Datenbank? 


e Datenbank: „System zur Beschreibung, Speicherung und 
Wiedergewinnung von umfangreichen Datenmengen, die 
von mehreren Anwendungsprogrammen benutzt werden." 
Aus: Schülerduden “Die Informatik”, 1986. 


e „Es besteht aus der Datenbasis, in der die Daten abgelegt 
werden und den Verwaltungsprogrammen (Datenbank- 
software, Datenbankmanagementsystem)...” Aus: s. o. 


e _Datenspeicherung in Dateisystem Datenspeicherung in Datenbanksystem 
Benutzer 1 Benutzer 2 Benutzer 1 Benutzer z 
Frogl Prog? Frag3 Frogi Pragz Prag3 
Dateıl Date? Dateı3 DEMS 


Datenbasis 
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Relationale Datenbanken: Modellierung & Zugriff 


e Datenbank-Architektur: 3-Ebenen-Modell (1975) 


Externe Externe e Externe Ebene: Sichten (Views) bestimmter 
Ebene 1 Ebene 2 Anwender auf die DB, wobei jeder nur die für 


ihn relevanten Daten sieht. 

Externe OPAC-Benutzer > Autor, Titel, Jahr... 

ee: Infoschalter — zusätzlich Entlehnstatus 
Katalogisierer — alle bibliographischen Daten 
Administrator — ALLE Daten, auch über Zugriffe 


Konzeptuelle ©  Konzeptuelle Ebene: Logische Struktur der 
Ebene DB, die Daten, deren Eigenschaften und 
Beziehungen zueinander beschreibt. 
— Datensatz „Buch“ kann mit mehreren Sätzen 
„Exemplar“ in Relation stehen, enthält 50 Zeichen 
langes Datenfeld „Autor“ vom Datentyp „string“ etc. 


Interne 


ee e Interne Ebene: Physische Struktur der DB, 


die Details zur Speicherorganisation enthält 
und Leistungsfähigkeit der DB bestimmt. 
— Auf welcher Festplatte welches Rechners liegen die 
Daten? Welche Mechanismen werden verwendet, um 
möglichst schnell darauf zugreifen zu können? ... 
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e Datenbank-Architektur: Datenunabhängigkeit 


Externe Externe 
Ebene 1 Ebene 2 


e Logische Datenunabhängigkeit: Änderungen 
Externe auf der konzeptuellen und damit auch internen 
Ebene.. Ebene haben (meist) keine Auswirkungen auf die 
externe Ebene. 
— Wird bei jedem Datensatz „Buch“ ab sofort ein Daten- 
feld „ISBN-Nummer` mitgespeichert, müssen auf der 


Konzeptuelle 
Fbene externen Ebene nur Jene Anwendungsprogramme ver- 
ändert werden, die das Feld tatsächlich benutzen sollen. 
e Physische Datenunabhängigkeit: Anderungen 
auf der internen Ebene haben keine Auswirkun- 
n gen auf die darüber liegenden Ebenen. 
Interne — Wird auf der internen Ebene ein bestimmter Zugriffs- 
Ebene mechanismus optimiert, muss auf der externen Ebene 


kein Anwendungsprogramm umgeschrieben werden. 
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e Datenbank-Modelle: Hierarchische Datenbank 


e Ältestes Modell, bereits Ende der 50er-Jahre für Einsatz auf 


Großrechnern entwickelt. DL/1 von IBM im Bereich von 


Banken und Versicherungen heute noch im Betrieb, war 1990 


noch schnellste DB mit > 1000 Transaktionen/Sekundel! 


e Verknüpfung von Datensätzen inform einer hierarchischen 
Baumstruktur: Es gibt genau eine „Wurzel und jeder 


Datensatz hat genau einen „Vorgänger“. — Parent / Child. 


e Bsp. Abfrage einer DL/1-DB: Überstunden 
des Mitarbeiters Nr. 130 vom 05. 01. 1983 


CALL CBLDLI (6, GU, PCB, WAPO6, 
Bi = Q-SSA-PO1, Q-SSA-P05, Q-SSA-P06) 
Q-SSA-P01: P01 (POLPNR = 130) 
Enn HHA Q-SSA-P05: P05 (POSADAT = 8301) 
Q-SSA-PO6: P06 (PO6ATAG = 05) 


GU ... Get Unique (Direktzugriff) 
SSA Segment Search Argument 
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e Datenbank-Modelle: Netzwerk-Datenbank 


e Modell wurde 1974 als ANSI-Norm verabschiedet, IBM 
stimmte dagegen, weshalb es wenig Verbreitung fand. 
UDS: Wichtigste DB für SIEMENS-Großrechner unter BS2000. 


e Verknüpfung von Datensätzen als Netzwerk: Suche, auch: 
Navigation, kann mehrere Einstiegspunkte („Wurzeln“) 
haben, Datensatz kann mehrere „Vorgänger“ haben. 


e Hierarchische und Netzwerkdatenbanken 
— Satzorientierte Datenbanken: 


L E - Entwicklung durch Hardware-Firmen 
E m - Hohe Performance auf Großrechnern 
- Hoher Aufwand an Personal für 
Entwicklung und Betrieb 
E m I 


- KEINE logische bzw. physische 
Datenunabhängigkeit gegeben: 
Umschreiben aller Anwendungen bei 
konzeptuellen / internen Änderungen 
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e Datenbank-Modelle: Relationale Datenbank 


e 1970 - 1975: IBM-Forschungsprojekt unter Edgar F. Codd zur 
Entwicklung eines Konzepts für relationale Datenbanken. 
Prototyp: System/R mit Zugriffssprache Sequel, einem 
Vorläufer von SQL (Structured Query Language). 


e Teil der Gruppe entwickelte IBM DB2, anderer Teil gründete 
Firma Oracle, die 1978 erstes System auf den Markt brachte. 
Andere Systeme: MS SQL Server, MS Access, mySQL (frei). 


e Objekte, deren Eigenschaften und Beziehungen zueinan- 
der werden im relationalen Modell durch Tabellen dargestellt. 
Verbindung von Tabellen durch Schlüsselfelder mit gleichem 
Wert. — Mengenorientierte Datenbanken. 


[Name _ TVomame [ot _ 


Po OD Fiche [an]. |] 


ee — 


Untereorf 
a G b l. 


4758 23864 
2145 86541 — | =tadteil =— 
L. T [e [Le 
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e Datenbank-Modelle: Objektorientierte Datenbank 


e Objektorientiertes Paradigma kommt aus Programmierung. 
Definition von gekapselten Objekten mit deren Attributen / 
Methoden, welche untereinander Nachrichten austauschen 
können. Hierarchische Anordnung in Klassen, Möglichkeit der 
Vererbung von Attributen und Methoden. 


e OODBMS (Object Oriented DB Management System) erlaubt 
im Gegensatz zu RDBMS frei definierbare Schachtelung von 
komplexen Strukturen. Umsetzung: Caché von Intersystems. 


e Bsp. Definition einer Klasse „Ort zum 
Speichern von Distanzen in OODBMS 


—— A DJ class Ort { 
— 9 — attribute string Name; 
struct Entfernung { 
relationship Ort Zielort; 
attribute short Kilometer; }; 


array (struct Entfernung) 
Entfernungen; } 
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e Datenbank-Modelle: Objektrelationale Datenbank 


e Erweiterung von RDBMS um grundlegende objektorientierte 
Konzepte, ohne Komplexität von OODBMS zu erreichen. Bsp. 
Oracle 8i / 9i, IBM DB2 UDB, Informix Dynamic Server. 


e ORDBMS erlaubt Verwendung von Objekten als selbst 
definierte komplexe Datentypen und Darstellung 
von Relationen zwischen Mengen von Objekten. 


Bsp. GIS - Geographisches Informationssystem: Koordinaten stehen in 
Relation zueinander und bilden Objekt „Position“. Positionen stehen in 
Relation zueinander und bilden Objekt „Straße“. 
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e Was sind Entitäten und Attribute? 


e Entität, Objekt, Tupel: Individuelles und identifizierbares 
Exemplar von Dingen oder Begriffen der realen oder der 
Vorstellungswelt. Bsp. Autor „Albert Camus“, Buch „Der Fall”, 
Schlagwort „Existenzialismus". 


e Attribut, Eigenschaft: Merkmal, das einer Entität zugeordnet 
wird und deren Charakterisierung, Klassifizierung oder 
Identifizierung ermöglicht. Bsp. Autor „Albert Camus“ mit 
Attributen Geburtsjahr „1913“ und Sterbejahr , 1960". 


e Entitätstyp, Objekttyp: Klasse von Objekten mit körper- 
licher oder begrifflicher Existenz. Bsp. Dublin-Core-Felder 
„Title“, „Creator“, „Subject“ etc. sind Entitätstypen. 


e Traditionelle EDV Datenmodellierung RDB 
Datensatz Entität Zeile 
Datenfeld Attribut Spalte 
Datei Entitätstyp Tabelle 
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e Was sind Relationen? 


e Relation, Beziehung: Verbindung von zwei Entitätstypen. 
Bsp. Autor „hat verfasst" Buch. Exemplar „liegt in” Regal. 
(Jede Tabelle einer RDB ist selbst eine Relation, daneben 
können Relationen zwischen Tabellen definiert werden.) 
Relation kann auch Attribute aufweisen. Bsp. Kardinalität: 


e 1:1 - Relation: Eine Entitat des ersten Typs ist entweder mit keiner 
oder mit genau einer Entität des zweiten Typs verbunden. 
Bsp. Mann „ist verheiratet mit" Frau. (In monogamen Gesellschaften 
hat ein Mann entweder keine oder eine Frau.) 


e 1:n- Relation: Eine Entitat des ersten Typs ist mit beliebig vielen 
Entitäten (0, 1 oder mehr) des zweiten Typs verbunden. 
Bsp. Abteilung „beschäftigt Mitarbeiter. (Abteilung hat mehrere 
Mitarbeiter, keiner von ihnen kann in mehreren Abteilungen arbeiten.) 


e m:n- Relation: Beliebig viele Entitäten des ersten Typs sind mit 
beliebig vielen Entitäten des zweiten Typs verbunden. 
Bsp. Person „entlehnt" Buch. (Person kann mehrere Bücher entlehnen, 
Buch kann von mehreren Personen entlehnt werden.) 
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e Entity Relationship Model: 
Bedeutung der Symbole 


e Entitätstyp Rechteck 


Attribut Ellipse 
Relation Linie - Deltoid - Linie 


Diagramm-5ymbole für Beziehungen (relation ships} 


dbaufüß.gif 
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e Entity Relationship Model: 
Beispiel für Grob-ERM einer Bibliothek 


BENUTZER AUSLEIHE 


KATALOG 


BIBLIOG RAPHIEN 
REPARATUREN 


BESTELLUNGEN 


<> 


LIEFERANTEN 


GESCHÄFTSGANG 
STATUS BUCHBINDER 


BESPIEU: VERKNÜPFUNG VERSCHIEDENER ENTIMÄTEN IN EINER BIBLIOTHEKU 
dba ma.gir 
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e Was sind Primärschlüssel und Fremdschlüssel? 


e Primärschlüssel, Entitätsschlüssel, primary key: dient der 
eindeutigen Identifizierung einer Entität in einer RDB, 
kann aus einem oder mehreren Attributen bestehen. 


Bsp. ISBN eines Buches; Signatur eines Exemplars, bestehend 
aus ISBN und laufender Nummer; Kundennummer eines 
Bibliotheksbenutzers. 


e Fremdschlüssel, foreign key: dient der Realisierung von 
Beziehungen zwischen Tabellen in einer RDB, ist ein 
Primärschlüssel aus einer anderen Tabelle. 


Bsp. ISBN ist Primärschlüssel in Tabelle „Buch“ und Fremd- 


schlüssel in Tabelle „Exemplar“, weil sich Exemplare immer 
auf ein bestimmtes Buch beziehen müssen. — 1 : n - Relation. 
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e Bsp. Tabellen mit Schlüsseln und Beziehungen 


e 3 Tabellen: ADRESSEN (> Käufer), KAEUFE, ARTIKEL. 
2 Relationen: ADRESSEN (> Käufer) „tätigen“ KAEUFE. 
ARTIKEL „werden gekauft durch“ KAEUFE. 


Anm.: ADRESSEN „kaufen“ ARTIKEL wäre m : n - Relation, die in einer 
RDB nicht direkt abgebildet, sondern nur durch zwei 1: n - 
Relationen dargestellt werden kann. KAEUFE ist „Zwischentabelle“. 


e Primary K.: ADRESSEN.NR, KAEUFE.KAUFNR, ARTIKEL.ARTNR. 
Foreign K.: KAEUFE.NR, KAEUFE.ARTNR. 


Anm. Schreibweise: <Tabellenname>.<Feldname>. Relation immer 
vom Primärschlüssel (1) zum Fremdschlüssel (n) dargestellt. 


| ADRESSEN ARTIKEL 
NR í ARTNR 
ARTNAME 


HAUSNR 
PLZ 
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e Datenintegrität: Prüfung durch das RDBMS 


e Entitäts-Integrität, Objekt-Integrität: Jeder Primärschlüssel 
darf nur einmal vergeben werden, damit die dazugehörige 
Entität eindeutig identifizierbar bleibt. Jedes Attribut, das 
Teil eines Primärschlüssels ist, muss stets befüllt sein. Anm.: 
Einem Attribut, das momentant keinen expliziten Wert enthält, weist 
das System den symbolischen NULL-Wert zu, der nicht 0, sondern 
LEER bedeutet. Ein Attribut, das Teil eines Primärschlüssels ist, darf 
also niemals NULL sein. 


e Referenzielle Integrität, Verweis-Integrität: Ein Fremd- 
schlüssel darf nicht ohne dazugehörigen Primärschlüssel 
vorhanden sein. Bsp. Ein Benutzer, der noch ein Buch ausgeliehen 
hat, darf nicht gelöscht werden können. 


e Wertebereichs-Integrität, Domänen-Integrität: Abgesehen 
vom Datentyp eines Attributs, kann dessen Wertebereich 
per Definition eingeschränkt werden. — Constraints. 

Bsp. Feld „Status“ in Tabelle „Exemplar“ darf nur Werte „P“ (am Platz), 
„E“ (entlehnt), „R“ (in Reparatur) oder „U“ (unbekannt) enthalten. 


Michael Horvath 12-2005 42 


Relationale Datenbanken: Modellierung & Zugriff 


e Was ist SQL? 


e SQL (Structured Query Language): Standardisierte (SQL1 
1986 und SQL2 1992), herstellerunabhängige und nicht- 
prozedurale („Was ist das Problem?" statt „Wie löse ich das 
Problem?”) Programmiersprache zum Erzeugen und 
Betreiben von relationalen Datenbanken. 


e DDL (Data Definition Language): Befehle zum Erstellen 
(CREATE), Andern (ALTER) oder Löschen (DROP) von 
Datenbanken oder darin enthaltenen Strukturen. 


e DML (Data Manipulation Language): Befehle zum Einfügen 
(INSERT), Andern (UPDATE), Löschen (DELETE) oder 
Abfragen (SELECT) von Datenmengen. 


e DCL (Data Control Language): Befehle zur Wahrung der 
Konsistenz (COMMIT, ROLLBACK) und Sicherheit 
(GRANT, REVOKE) von Datenbanken. 
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e SQL: Statement in Data Definition Language 


e CREATE TABLE exemplar 
( 


ex isbn CHAR (10) NOT NULL, 
ex lfd nr NUMBER (2) NOT NULL, 
ex status -CHAR(1) NOT NULL, 


ex zustand VARCHAR (1000), 


CONSTRAINT ex primaerschluessel 
PRIMARY KEY (ex isbn ; ex 1rd nr), 


CONSTRAINT ex _ fremdschluessel von buch 
FOREIGN KEY (ex isbn) REFERENCES buch (bu isbn), 


CONSTRAINT ex _ werte fuer status 
CHECR (6x Srarus IN ATP jg TE z TRY jg "UR)) 
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e SQL: Statement in Data Manipulation Language 


e Abfrage: 


SELECT ex isbn „ ex Ifd nr y 


bu_ autor „ Du Titel 


FROM exemplar , buch 
WHERE exemplar.ex isbn = buch.bu isbn 
AND exeiplar.exz Cacus = Ty! 


ORDER BY bu autor , bu titel 


[4 


e Ergebnis der Abfrage ist wieder eine Tabelle: 


ex isbn ex Ifd nr bu autor bu titel 

3150064619 01 Kant Kritik der rein... 
3150071143 03 Nietzsche Jenseits von Gu... 
35316100122 07 Wittgenstein Tractatus logic... 
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e SQL: Transaktionslogik 


e Transaktion: Logisch zusammengehörige Befehlsfolge, die 
nur entweder vollständig oder gar nicht ausgeführt wird. 
Bsp. Geldüberweisung, Entlehnung. 


e Transaktion wird von einem Benutzer der DB gestartet bzw. 
beendet, andere Benutzer sehen Datenänderungen erst nach 
erfolgreichem Beenden einer Transaktion. — Konsistenz der 
Daten bleibt auch bei Stromausfall während der Transaktion gegeben! 


e COMMIT: Transaktion beenden, Aktualisierungen endgültig 
im System speichern. 


e ROLLBACK: Ursprünglichen Zustand vor der laufenden 
Transaktion wieder herstellen. 


° > Sauer, Hermann: 
„Relationale Datenbanken / Theorie und Praxis". 
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